Corpus for Benchmarking Clinical Speech De-identification
이 논문은 프라이버시 제약과 주석의 복잡성으로 인해 부족했던 임상 음성 비식별화 연구를 위해, 38 가지 민감 건강 정보 범주로 시간 정렬 주석이 달린 20 시간 규모의 SREDH-AICup 음성 코퍼스를 구축하고 그 구성과 특성을 제시한 것입니다.
193 편의 논문
이 논문은 프라이버시 제약과 주석의 복잡성으로 인해 부족했던 임상 음성 비식별화 연구를 위해, 38 가지 민감 건강 정보 범주로 시간 정렬 주석이 달린 20 시간 규모의 SREDH-AICup 음성 코퍼스를 구축하고 그 구성과 특성을 제시한 것입니다.
이 논문은 초기 단계 종양학 임상, 생체표지자, 약동학 데이터를 통합하여 분석 준비형 데이터셋, 시각화 요약, 탐색적 예측 모델을 생성하는 재현 가능한 파이썬 기반 건강정보학 파이프라인을 개발하고 검증한 것을 보여줍니다.
이 연구는 MIMIC-IV 데이터를 활용하여 구조화된 임상 데이터와 임상 기록 텍스트를 결합한 멀티모달 머신러닝 모델을 개발함으로써 입원 중 고농도 오피오이드 노출을 정확하게 예측하고 표적 오피오이드 관리 전략을 지원할 수 있음을 입증했습니다.
이 논문은 불규칙하게 샘플링된 임상 데이터를 기반으로 치료 효과를 반사실적으로 예측하기 위해 시간 인식 어텐션 메커니즘과 G-계산을 통합한 'Time-Aware G-Transformer' 모델을 제안하고, 이를 통해 기존 방법보다 우수한 장기 예측 정확도와 불확실성 보정을 달성했음을 보여줍니다.
이 연구는 서아프리카 임상가들과 기술 전문가를 대상으로 한 혼합 방법론 연구를 통해 AI 통합의 안전성과 신뢰성을 확보하기 위해 독립적인 규제 기구, 투명한 책임 소재, 그리고 실시간 모니터링 체계가 필수적임을 규명했습니다.
이 논문은 41 명의 참가자 데이터를 기반으로 경사 부스팅 분류기와 은닉 세미 마코프 모델을 결합한 하이브리드 프레임워크를 통해 생리 증상만으로도 생리 주기 4 단계를 호르몬 검증 라벨과 함께 67.6% 의 정확도로 분류할 수 있음을 입증했습니다.
이 연구는 포르투갈 의료 현장에서 29 명의 임상 의사를 대상으로 한 전향적 파일럿 시험을 통해, DR. INFO 라는 에이전트 기반 AI 임상 보조 도구가 시간 절약과 임상적 의사결정 지원 측면에서 높은 만족도와 지속적인 효용성을 입증했다고 요약할 수 있습니다.
이 논문은 MedMCQA 의 1,000 개 질문을 기반으로 LLaMA, Qwen, Gemma 계열의 경량 오픈소스 LLM 들을 정확도, 효율성, 일관성 등 다각적 지표로 평가하는 경량 벤치마크 프레임워크 'MedScope'를 제안하고, 현재 모델들의 성능 편차와 고위험 의료 환경 단독 배포의 한계를 규명했습니다.
본 연구는 유럽의 주요 임상시험 스폰서 40 개를 대상으로 데이터 공유 정책 및 계획을 조사한 결과, 민간 스폰서가 공공 스폰서보다 구체적이고 실행 가능한 공유 문서를 제공하는 반면 공공 스폰서는 고수준의 약속만 제시하는 등 부문의 불균형이 존재함을 확인했습니다.
이 연구는 요양원 간부 간 텍스트 메시지에서 '4M(중요한 것, 약물, 정신, 이동성)' 정보를 추출하기 위해 미세 조정된 토큰 분류기와 오픈 소스 대규모 언어 모델 (LLM) 의 수정 단계를 결합한 다단계 파이프라인을 개발하여, 기존 단일 모델보다 높은 정확도와 효율성을 달성했음을 입증했습니다.
이 논문은 희귀 신장 질환 환자의 비정형화된 임상 기록에서 세럼 크레아티닌과 같은 장기적 생체 표지자를 추출하기 위해 소규모 언어 모델 (SLM) 기반 파이프라인의 효율성과 실용성을 입증했습니다.
이 논문은 기존 벤치마크가 간과한 임상 의학 연구의 고유한 복잡성을 해결하기 위해, NHANES 와 SEER 데이터를 기반으로 7 개 임상 분야와 6 가지 평가 차원을 포함하는 최초의 AI 연구 에이전트 평가 벤치마크인 'MedResearchBench'를 제안하고 그 유효성을 입증합니다.
이 논문은 알츠하이머 및 관련 치매 (ADRD) 의 행동 및 사회적 요인 (BSFs) 을 체계적으로 표현하고 통합하기 위해 기존 온톨로지를 기반으로 개발된 'BSOAD'를 소개하고, 전문가 검토와 LLM 기반 평가를 통해 그 품질과 확장성을 입증했습니다.
이 논문은 희귀질환 데이터베이스 구축 과정에서 개발된 '검증 시스템 (VaaS)' 파이프라인이 다층적 검증 프로토콜을 통해 과학적 AI 의 환각 오류를 거의 제로 수준으로 낮추고, 저비용으로 대규모 생산 환경에서도 인용 무결성을 보장할 수 있음을 실증적으로 입증했다고 요약할 수 있습니다.
이 논문은 대규모 소아 응급 환자 코호트에서 기존 모델보다 우수한 성능을 보이며 환자별 임상 이벤트 시퀀스를 학습하고 하위 군집을 식별하며 이상 징후를 탐지하는 해석 가능한 'ClinicalTAAT'라는 시간 인지형 트랜스포머 모델을 제안하여 임상 프로세스 분석을 위한 확장 가능한 데이터 기반 프레임워크를 제시합니다.
스위스 소아병원들의 이력상 데이터를 분석한 스위스페드그로스 (SwissPedGrowth) 프로젝트는 다양한 전자건강기록 시스템에서 인체계측 데이터를 추출하고 품질을 평가하는 것이 가능함을 입증했으나, 데이터의 완전성과 조화 측면에서는 여전히 과제가 남아 있음을 보여주었습니다.
이 논문은 임상적 의사결정에서 대형 언어 모델이 단계별 정보 입력 시 초기 진단을 유지하지 못하는 '수렴 회귀' 현상을 규명하고, 이를 측정 및 교정하는 새로운 진단 도구 (SIPS) 와 평가 체계를 제안하여 AI 의 추론 병리를 가시화하고 거버넌스 요구사항을 정량화할 수 있음을 입증합니다.
이 논문은 예측 성능과 모델 다양성을 동시에 최적화하는 다목적 앙상블 프레임워크인 MOE-ECG 를 제안하여, 다양한 ECG 데이터셋에서 심방세동 (AFib) 을 강력하고 정확하게 탐지하는 새로운 솔루션을 제시합니다.
이 연구는 26 개의 임상 시험에서 3 만 9 천여 명의 환자를 대상으로 한 인간-루프 (human-in-the-loop) 방식의 ChatGPT 기반 선별 시스템이 높은 정확도와 낮은 비용으로 임상 시험 적합성 판별 효율을 크게 향상시켰음을 보여줍니다.
이 논문은 다양한 임상 코드를 포함하는 불규칙한 시계열 전자의무기록 (EHR) 데이터를 효과적으로 모델링하기 위해, 이벤트 내 및 이벤트 간 구조와 경과 시간을 동시에 고려하는 이중 수준 시간 인식 트랜스포머 'HealthFormer'를 제안하고, 대규모 헝가리 국가 건강 기록을 활용한 자기지도 학습을 통해 다양한 암 발생 예측 과제에서 기존 기법보다 우수한 성능을 입증했습니다.